Bidi 配对支架
Bidi Paired Bracket 属性缩写为 bpb,适用于 128 个 Unicode 字符,将括号或方括号等字符标识为形成配对括号。它对于双向文本渲染至关重要,它确保具有混合方向的脚本中的准确布局和排序。
分解映射
分解属性缩写为 dm,适用于 17029 个 Unicode 字符,指的是字符可以分解为其组成部分的方式。它对于文本规范化和跨不同脚本的兼容性至关重要。
大写
在 Unicode 中,Upper Case 属性用大写形式标记字符,这对于保持大小写一致至关重要。此属性适用于 1527 个 Unicode 字符,有助于跨不同脚本和语言进行精确区分大小写的操作。
完整成分排除 - 标准化表格 KC
Unicode 中的完整组合排除属性,缩写为 FC_NFKC,适用于 637 个 Unicode 字符。此属性可识别在使用规范化形式 KC 进行规范化期间从完整组合中排除的字符,这对于准确的文本处理和编码至关重要
小写
在 Unicode 中,Lowercase 属性告诉我们哪些字符具有小写版本。它可以帮助计算机理解如何使用字母而不关心大小写,从而使搜索和文本处理等事情变得更容易。此属性适用于 1433 个 Unicode 字符。
标准化表格 KC - 皮套
NFKC_CF适用于6317个Unicode字符,确保文本处理的一致性和语言兼容。它超越了传统的大小写更改,纳入了统一字符比较的调整。此属性对于增强跨不同语言环境的兼容性和促进可靠的文本操作至关重要。
标题框
Unicode 中的标题大小写属性标识具有特殊形式的标题首字母的字符。这对于标题或标题中正确的大写至关重要。此属性适用于 1452 个 Unicode 字符。
比迪镜像字形
Bidi Mirrored Glyph 属性在 Unicode 中缩写为 bmg,适用于 428 个字符,标识双向文本中具有镜像对应项的字形。这些字符在从右到左的上下文中出现时会发生视觉变化,从而确保具有混合方向性的脚本中的正确视觉呈现和可读性。
等效统一表意文字
Unicode 中的等效统一表意文字缩写为 EqUIdeo,可确保具有相同含义的不同外观字符被视为等效或相同。这简化了文本处理,使其在各种上下文中保持一致和标准化。
简单大写
Simple Uppercase 属性,缩写为 suc,适用于 1450 个 Unicode 字符。它表示可以使用简单大写版本的字符。此属性简化了大写转换,确保指定字符集的文本处理的一致性和简单性。
简单小写
Simple Lowercase 属性,缩写为 slc,适用于 1433 个 Unicode 字符。它与具有简单小写版本的字符特别相关。此属性简化了小写转换,确保指定字符集的文本处理的一致性和简单性。
简单的标题
Simple Titlecase 属性(在 Unicode 中缩写为 stc)适用于 1404 个字符,允许直接转换为其标题形式。这有助于实现简单标题格式的一致大写,简化文本处理并增强演示效果。
简单的箱子折叠
Simple Case Folding 属性,缩写为 scf,适用于 1454 个 Unicode 字符。它代表了对大小写折叠形式的直接转换,确保了不区分大小写操作的一致性。此属性有助于简化各种情况下的搜索和模式匹配等任务。
表壳折叠
Case Folding 属性,缩写为 cf,适用于 1530 个 Unicode 字符。它包含全面的折叠转换,有助于不区分大小写的文本处理。此属性可确保比较操作的一致性,对于跨不同情况的搜索和模式匹配等任务非常有价值。